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fi 2: [目的 / 意义] 梳理 全 文本 引文 分 析 当 前 发 展现 状 ， 明 确 国 内 外 全 文本 引文 分 析 的 不 同 侧重 ， 剖 析 全 文本 引文 分 析 画 
虱 的 挑战 以 及 未 来 可 能 的 发 展 方向 。 [方法 / 过 程 ] 通 过 回顾 国内 外 关于 全 文本 引文 分 析 相 关 研 究 性 论文 结果 ， 将 全 文本 引文 
分 析 研究 内 容 总 结 为 引用 位 置 分 析 、 引 用 强度 分 析 、 引 用 语 境 分 析 ， 并 对 全 文本 引文 分 析 在 路 学 科 、 科 学 评价 等 领域 上 的 应 
进行 分 析 ， 并 总 结 国内 外 全 文本 引文 分 析 差 异 。 [结果 / 结论 ] 通过 文献 梳理 ， 发 现 全 文本 引用 分 析 目 前 在 引用 位 置 上 的 和 
究 与 章节 结构 有 重要 联系 。 引 用 强度 分 析 与 引用 位 置 分 析 结 合 紧密 ， 并 注重 开发 新 的 计算 方法 。 引 用 语 境 上 ， 全 文本 引用 分 
析 的 热点 主要 是 情感 分 析 。 应 用 集中 在 交叉 学 科 测度 以 及 科学 评价 体系 构建 上 。 本 研究 还 针对 全 文本 引文 分 析 面 临 的 挑战 以 
今后 的 发 展 方向 做 出 了 预测 。 
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1 引 


Di} 


引文 分 析 是 文献 计量 学 中 的 重要 研究 领域 ， 通 过 
分 析 文献 中 的 引用 关系 ， 研 究 文献 的 引用 行为 和 学 术 
影响 力 。20 世纪 90 年 代 以 来 ， 研 究 者 们 开始 就 全 引文 
对 文献 进行 研究 分 析 ， 传 统 的 引用 分 析 主 要 基于 参考 
文献 列表 和 作者 引用 标识 ， 但 这 种 方法 存在 一 些 问题 ， 
如 无 法 识别 全 文本 引用 和 保证 引用 的 准确 性 ， 也 较 少 
涉及 引用 内 容 的 分 析 。 随 着 文本 挖掘 以 及 机 器 学 习 技 


开放 ， 全 文本 引文 分 析 方 法 得 到 了 快速 发 展 ， 成 为 文 
献计 量 学 研究 的 重要 方向 。 

全 文本 引文 分 析 是 一 种 通过 分 析 文 献 中 的 文本 信 
息 ， 自 动 识别 文献 间 的 引用 关系 的 分 析 方法 。 相 较 于 
传统 的 引用 分 析 ， 全 文本 引文 分 析 更 加 准确 和 全 面 ， 
能 够 帮助 研究 者 更 好 地 了 解 文献 的 引用 关系 和 学 术 影 
响 。 全 文本 引文 分 析 主 要 涉及 机 器 学 习 和 自然 语言 处 
理 技术 ， 包 括 文 本 特征 提取 、 聚 类 分 析 、 关 键 词 抽取 、 
主题 模型 和 情感 分 析 等 。 

目前 ， 全 文本 引文 分 析 已 经 在 文献 计量 学 、 科 学 


评价 、 学 科 发 展 趋势 分 析 等 领域 得 到 了 广泛 的 应 用 。 


术 的 进一步 发 展 ， 全 文 开放 数据 库 陆续 成 立 并 对 公众 3 领域 得 
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然而 ， 随 着 数据 量 的 增加 ， 全 文本 引文 分 析 也 面临 着 
一 些 挑战 ， 如 数据 质量 、 精 度 和 效率 、 跨 语言 引用 分 
析 等 问题 。 因 此 ， 需 要 对 全 文本 引文 分 析 进 行 梳 理 ， 
以 更 好 地 推动 全 文本 引文 分 析 发 展 。 

在 正式 检索 前 对 全 文本 研究 领域 文章 进行 初步 检 
索 ， 检 索 词 初步 设 定 为 全 文本 引文 分 析 及 其 同义词 ， 
并 在 检索 过 程 中 根据 检索 所 得 文章 的 具体 研究 对 象 的 
细 分 对 关键 词 进行 补充 完善 。 最 终 本 文 以 关键 词 (全 
文本 分 析 、 引 用 强度 分 析 、 引 用 情感 分 析 、 引 用 位 置 
分 析 、3 引 用 动机 分 析 、 引 用 分 析 评 价 体 系 、 跨 学 科 引 
文 分 析 、 引 文 分 析 应 用 等 ) 的 英文 单词 构造 相关 检索 
式 ， 关 键 词 关系 为 OR， 在 Web of Science 中 进行 主题 
ER, WEHA Article， 和 筛选 早期 高 被 引文 章 ， 
并 明确 时 间 跨 度 为 2000—2023 年 ， 共 得 到 135 篇 非 综 
述 类 型 相关 文章 ， 根 据 文章 题目 以 及 摘要 进行 人 工 得 
选 得 到 相关 文献 共 72 篇 。 与 此 同时 用 相应 中 文 名 词 构 
造 关 键 词 检 索 式 并 在 中 国 知 网 (CNKI) 上 进行 主题 检 
索 ， 初 步 得 到 文献 共 128 篇 ， 同 样 对 文章 标题 以 及 摘 
要 进行 人 工 筛选 ， 最 终 得 到 中 文 文献 33 篇 。 最 后 对 中 
英文 文章 进行 综合 ， 去 除 同 作者 相似 文章 。 如 此 ， 共 
检 得 文献 125 篇 以 进行 下 文 分 析 。 

在 检索 所 得 文献 的 基础 上 ， 对 全 文本 引文 分 析 进 
行 系统 梳理 。 根 据 检 索 所 得 文章 的 具体 研究 内 容 归 类 
主要 分 为 对 于 全 文本 内 容 具体 分 析 以 及 全 文本 分 析 的 
具体 应 用 。 故 可 将 文章 结构 主要 分 为 以 下 3 部 分 。 第 
一 部 分 全 文本 引文 分 析 的 研究 内 容 ， 又 可 分 为 引用 位 
置 分 析 ， 引 用 强度 分 析 ， 引 用 语 境 分 析 (主要 依据 各 
篇 文章 所 涉及 关键 词 以 及 词语 重复 程度 确定 分 为 以 上 
三 细 点 进行 分 析 )。 引 用 人 位置、 强度、 语 境 可 以 看 成 是 
引用 具体 内 容 的 3 个 不 同方 面 ， 引 用 所 处 的 文章 结构 
不 同 、 引 用 次 数 不 同 、 引 用 所 带 情感 选用 词语 等 语 境 
不 同 ， 引 用 的 效果 均 会 有 所 不 同 ， 具 体 展 开 见 下 文 。 
第 二 部 分 全 文本 引文 分 析 的 主要 应 用 ， 由 器 学 科研 究 ， 


2 全 文本 引文 分 析 的 兴起 与 发 展 


在 相当 长 一 段 时 间 里 ， 由 于 论文 数据 规模 不 大 ， 
全 文 文本 以 及 数据 难以 获取 等 原因 ， 全 文本 相关 分 析 
研究 以 及 相关 引文 研究 处 于 早期 阶段 ， 研 究 数量 稀少 。 
进入 本 世纪 ， 特 别 是 电脑 计算 机 技术 的 大 规模 应 用 以 
来 ， 开 放 获 取 运 动 逐 渐 兴 起 ， 自 然 语言 处 理 以 及 文本 
挖掘 等 技术 快速 兴起 与 发 展 ， 更 方便 获取 学 术 论 文 全 
文 数据 进行 分 析 ， 引 文 分 析 在 内 的 全 文本 分 析 研 究 重 
新 进入 众多 研究 者 的 视野 。BIRNDL、BIR 等 相关 国际 
专题 会 议 近年 来 兴起 ， 相 关 研 究 者 致力 于 信息 检索 与 
文献 计量 以 及 自然 语言 处 理 等 领域 交叉 研究 ， 共 同 探 
索 全 文本 内 容 分 析 本 身 以 及 其 在 文献 计量 、 信 息 检索 
等 领域 的 应 用 。 目 前 全 文本 引文 分 析 研究 内 容 主要 集 
中 在 引用 位 置 分 析 、 引 用 强度 分 析 、 引 用 语 境 分 析 以 
及 全 文本 引文 分 析 应 用 等 方面 1。 


3 全 文本 引文 分 析 的 研究 内 容 


3.1 引用 位 置 分 析 


全 文本 数据 的 逐渐 开放 ， 人 研究 者 们 可 以 不 局 限于 
文章 末尾 的 参考 文献 数据 ， 同 时 可 以 进一步 定位 参考 
文献 在 文章 中 被 引用 的 具体 位 置 。 关 于 引文 位 置 方向 
的 研究 ， 可 以 总 结 为 定性 与 定量 两 个 方面 。 

(1) 引用 位 置 定性 分 析 。 早 在 2000 年 ， 何 荣 利 等 
就 对 300 篇 文章 及 其 7857 篇 引文 在 引言 、 本 来 、 结 论 
3 个 部 分 的 分 布 数量 进行 了 研究 ， 得 出 引文 作用 与 所 在 
文章 部 分 有 关 ; 2010 年 李 燕 是 人 为 简单 根据 引文 和 被 
引 来 对 科技 期 刊 进行 排名 不 太 准 确 ， 并 以 此 为 契机 进 
行 研究 ， 最 终 发 现 引 文 在 文中 位 置 分 布 能 影响 其 引文 
效用 ; XUBRSEM, m Top SCI 文章 评价 体现 中 “引文 均 


科学 评价 以 及 其 他 领域 应 用 3 个 部 分 组 成 ， 第 三 部 分 
对 全 文本 引文 分 析 研 究 进 行 展望 ， 分 析 面 临 的 挑战 以 
及 未 来 可 能 的 发 展 趋势 。 
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等 ”这 一 假设 的 疑惑 ， 对 文章 引文 动机 认 知 理论 进行 
梳理 并 分 类 ， 最 终 研究 结果 显示 被 引文 献 在 施 引 文章 
的 引用 位 置 是 随时 间 的 变化 进行 有 规律 改变 。 

(2) 引用 位 置 定量 分 析 。2013 年 HALEVI 等 中 对 


Informetrics 杂志 2007 年 发 表 的 文章 进行 分 析 ， 分 析 了 
引文 在 文章 不 同 部 分 中 的 使 用 情况 ， 并 通过 矩阵 来 进 
行 定 量 部 分 的 计算 ; 2016 年 胡 志 刚 利用 可 视 化 对 引 
用 位 置 的 分 布 进行 直观 展示 ， 对 不 同年 份 的 引用 位 置 
和 不 同 被 引 次 数 引 文 的 位 置 进行 比较 ， 并 对 二 者 的 特 
点 归纳 总 结 ; 2017 年 章 成 志 等 "以 学 术 专 著 为 研究 对 
象 ， 对 其 进行 人 工 标 注 并 从 引文 内 容 位 置 分 布 等 角度 
分 析 学 术 专 著 的 引文 行为 。 这 一 研究 成 果 将 全 文本 引 
用 分 析 的 研究 对 象 从 常用 的 研究 性 论文 扩大 至 学 术 专 
车， 为 以 后 对 其 他 学 术 成 果 格 式 例如 专利 的 研究 起 到 
了 促进 作用 。 张 琳 等 外 基于 论文 的 不 同 章节 的 引文 标注 
位 置 对 学 科 交 又 度 进行 分 析 ， 结 果 表 明 引 言 、 讨 论 、 
方法 和 结果 4 个 章节 的 学 科 交 叉 程 度 依次 降低 中， 并 在 
此 基础 上 提出 了 加 权 TD 学 科 交 叉 测 度 指标 ， 为 引用 
位 置 分 析 进 一 步 应 用 提供 了 动力 。 


3.2 引用 强度 分 析 


引用 强度 分 析 主 要 是 指引 文 在 文献 中 的 被 引用 的 
次 数 及 其 再 不 同 段落 的 分 布 情况 。 一 般 来 说 ， 被 引 次 
数 的 多 少 与 引用 强度 的 大 小 成 正比 关系 。 但 这 其 中 也 
包含 了 引文 在 文献 中 被 多 次 引用 时 在 不 同位 置 的 分 布 
差异 状况 ， 分 布 不 同 ， 引 用 强度 的 大 小 也 会 不 同 。 

(1) 单 强度 分 析 。2013 年 DING 等 中 提出 了 两 种 
不 同 的 引用 强度 计算 方法 ， 分 别 命名 为 Count One 和 
CountX， 并 发 现 使 用 的 计数 不 同 导 致 的 分 析 结 果 也 有 
所 差异 ， 在 实际 的 研究 中 需要 根据 自己 的 研究 目的 进 
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的 不 同 之 处 。“ 全 文本 文献 计量 分 析 ” 沙 龙 上 提出 咏 ， 
需 将 引文 位 置 分 析 和 引文 强度 分 析 相 结 合 ， 并 对 其 全 
文中 的 分 布 进行 可 视 化 直观 展示 ， 寄 于 此 希望 对 引用 
行为 进行 更 直观 的 解读 。 


3.3 引用 语 境 分 析 


主要 涉及 内 容 词 和 线索 词 两 个 概念 ， 内 容 词 主 要 
包含 信息 的 核心 文本 内 容 ， 而 线索 词 只 需要 表示 作者 
引用 时 的 情感 以 及 状态 。 内 容 词 与 线索 词 二 者 共同 组 
成 了 引用 语 境 分 析 的 基础 。 对 于 引用 语 境 分 析 ， 主 要 
涉及 词语 选用 、 情 感 分 析 以 及 引用 动机 行为 分 析 3 个 
方面 。 

3.3.1 词语 选用 

在 引用 过 程 中 ， 不 同学 科 作 者 在 引用 时 所 选用 的 
词语 不 同 。 这 就 引出 了 用 词 偏好 与 引用 关系 之 间 的 探 
讨 ， 就 这 一 问题 ，HYLAND 号 表明， 文章 所 用 的 动词 
会 根据 学 科 喝 引用 语 境 的 不 同 而 发 生 明 显 的 动词 使 用 
差异 ， 并 且 人 文 社 科 的 学 者 比 其 他 学 科 的 使 用 的 引文 
更 多 ， 且 更 倾向 报告 动词 。KIM 等 利用 引文 内 容 和 
选用 词语 相似 程度 来 表明 作者 主题 词 中 的 可 能 的 隐 性 
关系 。 胡 志 刚 等 中 对 引用 语 境 分 析 中 的 连接 词语 ， 代 
词 以 及 行为 动词 进行 了 分 析 通 过 对 引用 过 程 中 的 线索 
词 进行 收集 ， 统 计 以 及 分 析 ， 对 于 使 用 词语 的 语 境 ， 
辨 明 不 同 词语 引用 的 功效 分 类 ， 以 及 对 引用 语 境 进行 
模型 构建 起 到 了 促进 作用 。ROSATIWS 基 于 语言 学 分 析 
语料库 ， 以 揭示 属于 每 种 引文 类 型 的 独特 且 具 有 统计 


m 


行 方 法 辨析 。 胡 志 刚 等 外 研究 分 析 了 引文 文章 数量 和 
引用 频次 这 两 者 之 间 的 联系 ， 并 在 此 基础 上 提出 了 一 
种 新 的 加 权 计 算 引 文 总 被 引 次 数 的 方法 ， 该 方法 在 科 
学 评价 方面 具有 重要 价值 。 明 志 刚 长 期 关注 该 领域 的 
RRN, H 2017 年 发 表 的 文章 四 中 ， 对 “怎样 的 引文 
更 容易 多 次 引用 ， 怎 样 的 施 引 文献 更 容易 进行 多 次 引 
用 ”这 些 问 题 进行 了 系统 性 的 研究 和 解答 。 

(2) 强度 与 位 置 结合 分 析 。 王 玉 琢 等 外 基于 上 述 
计算 方法 ， 以 及 后 来 出 现 的 自然 语言 处 理 领域 的 十 大 
算法 为 基础 ， 涉 及 全 文 引用 次 数 以 及 引用 的 位 置 ， 将 
十 大 算法 进行 比较 ， 得 出 每 一 套 算法 相 较 于 其 他 算法 


学 意义 的 语言 结构 。 
3.3.2 情感 分 析 
引用 与 情感 密切 相关 ， 在 引文 上 下 文 情感 分 析 方 
面 ， 可 以 分 为 分 类 研究， 方法 研究 以 及 模型 构建 。 
(1) 情感 分 析 分 类 研究 。 分 类 MUPPIDI 等 外 强调 
了 对 论文 中 引用 情绪 的 正极 性 和 负极 性 进行 分 类 等 问 
题 。 分 类 AMJAD 等 外 通过 使 用 VerbNet 本 体 、 自 然 语 
言 处 理 和 4 种 不 同 的 机 器 学 习 算 法 对 引文 文本 中 的 动 
词 进行 语义 分 析 ， 并 为 研究 人 员 提 出 了 一 种 面向 动词 
的 引文 情感 分 类 。 分 类 VYAS 等 外 对 于 引文 分 析 开 发 
了 8 个 包含 引文 句子 的 数据 集 ， 数 据 集 由 手动 注释 为 3 
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个 情绪 极 性 ， 即 积极 、 消 极 和 中 性 。 

(2) 情感 分 析 方 法 研究 。SMALL™3 在 文章 中 提出 ， 
对 引用 语 境 的 分 析 ， 需 要 用 一 种 广义 意义 上 的 情感 概 
念 来 进行 分 析 ， 并 要 尊重 涉及 引文 的 不 同 态度 和 情感 
倾向 。 该 研究 采用 语料库 以 及 语言 学 等 研究 方法 ， 对 
引文 语 境 中 出 现 的 线索 词 集 情况 进行 对 比分 析 。 
IKRAM 等 四 提出 了 一 种 识别 引文 情绪 的 新 方法 ， 以 揭 
示 学 术 大 数据 中 的 隐藏 模式 。ALJUAID 等 四 提出 了 一 
种 基于 文本 引文 情感 分 析 的 二 元 分 类 方法 ， 该 方法 有 
效 促进 了 相关 技术 的 发 展 。 

(3) 情感 分 析 模 型 研究 UMER 等 外 在 公开 可 用 
的 引文 情感 数据 集 上 使 用 机 器 学 习 模型 结合 基于 频率 
和 基于 预测 的 特征 表示 技术 的 模式 。MERCIER 等 四 根 
据 研 究 结果 提出 了 一 个 端 对 端的 可 训练 多 任务 模型 ， 
该 模型 涵盖 了 利用 域外 数据 集 克 服 数据 稀缺 性 的 情绪 
和 意图 分 析 。 

3.3.3 引用 动机 及 引用 行为 分 析 

研究 引用 行为 ， 可 以 利用 实证 调查 和 相关 数据 分 
析 去 验证 之 前 引文 分 析 得 出 的 结论 。 一 般 将 引用 动机 
与 引用 行为 的 研究 相 结 合 ， 将 之 前 通过 不 同 研究 方法 
得 出 的 引用 动机 进行 分 析 、 归 纳 和 合并 ， 得 出 若干 个 
重要 的 和 较为 完整 的 引用 动机 再 去 验证 其 有 效 性 。 首 
先 要 明确 所 依据 的 动机 和 行为 分 类 标准 ， 其 次 要 确定 
研究 方法 ， 再 确定 研究 对 象 以 进行 引用 动机 和 行为 分 
析 。 

(1) 分 类 研究 。 对 于 这 一 分 类 问题 ， 有 许多 学 者 
做 出 了 自己 的 判断 。TEUFEL 等 四 的 研究 中 ， 将 学 术 引 
文 进行 分 类 ， 以 此 来 对 科学 论证 呼吁 结构 与 引用 的 相 
互 关 系 进行 分 析 。 并 在 此 基础 上 体力 了 引用 动机 分 类 
体系 。SHEN 等 四 将 引用 分 为 “ 真 引 用 ”和 “ 假 引 用 ”， 
倡导 在 进行 文献 计量 分 析 时 ， 更 应 该 关注 文章 中 出 现 
的 “ 真 引用 ”。STEVENS 等 四 将 引用 文献 的 动机 分 为 
15 种 ， 其 中 包括 对 前 人 的 研究 表达 尊敬 、 尊 重 同行 的 
研究 成 果 、 研 究 方法 以 及 研究 工具 的 选取 与 比较 、 为 
全 文 提供 知识 背景 、 对 以 前 研究 的 修正 和 个 人 意见 的 
表达 、 对 前 期 研究 结果 的 批评 等 共 15 种 引用 动机 分 
类 。 胡 志 刚 多 将 引用 动机 和 行为 的 数据 分 成 两 种 : 一 
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是 基于 引用 内 容 的 数据 来 源 ; 二 是 基于 全 文 引 文 分 析 
的 数据 来 源 。 

(2) 方法 研究 。 对 于 引用 动机 的 研究 ， 使 用 的 研究 
方法 一 般 包 括 问 卷 调查 法 以 及 内 容 分 析 或 者 文献 计量 的 
方法 来 研究 引用 动机 。 外 问卷 调查 法 。WARRAICH 
等 外 为 了 研究 LIS 专业 毕业 生 的 引用 动机 及 其 行为 ， 进 
行 了 一 项 线 上 问卷 调查 。 吨 均 平等 外 的 研究 说 明 ， 引 
用 动机 和 行为 并 不 以 一 成 不 变 的 ， 利 用 调查 问卷 进行 
数据 手机 ， 科 研 人 员 之 间 的 相互 影响 对 引用 动机 和 行 
为 产生 一 定 的 影响 。 四 计量 分 析 法 。LIU 等 外 应 用 文本 
相似 度 算法 分 析 科 学 家 的 三 角 引 文 行为 。 刘 运 梅 等 外 
同样 利用 三 角 引 文 原理 ， 基 于 内 容 标注 ， 通 过 内 容 标 
注 的 方式 深入 挖掘 其 中 隐藏 的 引用 动机 。 

(3) 对 象 研究 。 引 用 动机 以 及 引用 行为 的 研究 并 
不 仅仅 局 限于 期 刊 论文 的 领域 ， 也 可 扩展 到 其 他 学 术 
成 果 形 式 。LI 等 外 对 于 专利 引用 动机 及 行为 做 出 研究 ， 
并 提出 4 种 假设 并 进行 验证 ， 以 探究 专利 引用 过 程 中 
的 动机 以 及 行为 问题 。 


3.4 全 文本 引文 分 析 的 主要 应 用 


全 文本 引文 分 析 在 文献 计量 学 、 
价 等 领域 具有 广泛 的 应 用 。 
3.4.1 全 文本 引文 分 析 应 用 于 跨 学 科研 究 

(1) 交叉 测度 研究 。 章 成 志 等 四 对 全 文 数据 库 中 
的 不 同学 科 的 交叉 情况 进行 引文 内 容 分 析 测 度 。 王 芳 
等 对 超过 50 本 情报 学 领域 杂志 中 的 近 1 000 条 理论 
进行 频次 统计 分 析 ， 并 分 析 了 各 个 理论 的 来 源 学 科 ， 
对 中 国情 报 学 的 理论 来 源 分 析 起 到 了 重要 作用 。 张 慧 
玲 等 外 使 用 引文 来 对 交叉 学 科 杂 志 进 行 识别 并 对 其 识 
别 方法 进行 研究 ， 从 跨 学 科 领 域 特性 的 研究 维度 出 发 ， 
XP AZ Tal AE BEDE T TIERED TS ORGS, RUE 
等 了 对 学 科 交 叉 成 都 进行 了 点 面 程度 研究 ， 探 讨 广义 
的 学 科 主 题 交 叉 与 侠义 的 学 科 主 题 交叉 是 由 相关 联 。 
此 后 外 在 前 面 研 究 成 果 基 础 上 ， 对 引文 内 容 和 词语 进 
行 抽取 收集 ， 以 探讨 交叉 度 计 算 方 法 ， 并 根据 计算 方 
法 设置 学 科 交 叉 度 测度 指标 ， 以 进行 量化 分 析 。 深 镇 
涛 等 外 基于 引文 角度 出 发 ， 研 究 某 一 领域 的 学 科 交 又 
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的 发 展 路 径 ， 并 以 眼球 追踪 领域 为 例 进行 了 实证 研究 。 
张 琳 等 外 为 了 探究 学 科 交 叉 测 度 的 多 样 性 指标 ， 基 于 论 
文 的 不 同 章节 的 引文 标注 位 置 对 学 科 交 叉 度 进行 分 析 ， 
结果 表明 引言 、 讨 论 、 方 法 和 结果 4 个 章节 的 学 科 交 
叉 程度 依次 降低 ， 并 在 此 基础 上 提出 了 加 权 TD 学 科 
交叉 测度 指标 ， 对 学 科 交 叉 度 测度 综合 指标 进行 了 更 
Bt. HUANG 等 外 基于 引文 分 析 和 语义 分 析 提 出 了 一 个 
新 的 衡量 跨 学 科 互 动 的 框架 。 

(2) 知识 流动 研究 。 除 了 对 交叉 情况 和 交叉 度 进 
行 研究 ， 还 可 以 通过 全 文本 引文 分 析 方 法 研究 知识 流 
动情 况 。 刘 丽 帆 等 中 采用 引文 内 容 分 析 法 ， 以 PLoS 平 
台 的 开放 学 术 论 文 全 文 数据 为 例 ， 选 取 其 中 的 引文 句 
为 研究 对 象 。 自 动 抽取 引文 句 中 包含 的 知识 ( 即 术 
iB), 再 结合 学 科 以 及 位 置信 息 ， 揭 示 跨 学 科 知识 流动 
现象 。 孔 玲 等 外 提出 了 针对 国内 图 书 情报 专业 的 学 科 
交叉 全 文本 引文 的 内 容 标 注 和 联系 分 析 框 架 ， 立 足 于 
分 析 引 用 强度 、 人 情感 、 位 置 及 对 象 关联 分 析 情 报 学 跨 
学 科 被 引 行 为 ， 并 在 此 基础 上 比较 情报 学 跨 学 科 知 识 
扩散 学 科 差 异 。 张 艺 蕊 等 多 结合 引文 内 容 分 析 和 全 文 
本 引文 分 析 ， 设置 了 施 引 、 原 始 以 及 参考 文献 集 这 3 个 
文献 集 ， 以 探索 学 科 内 部 与 学 科 间 知识 流动 的 趋势 中 。 
商 宪 丽 等 多 利用 自然 语言 处 理 技术 ， 从 交叉 领域 文献 
题 录 数据 、 人 参考 文献 文本 信息 以 及 引文 上 下 文中 抽取 
知识 短语 ， 深 入 揭示 交叉 领域 学 科 中 “知识 吸纳 一 知 
识 内 化 ”的 知识 整合 过 程 。 

(3) 对 外 影响 研究 。CHEN 等 四 衡量 了 中 国 图 书 情 
报 学 对 外 部 学 科 的 学 科 影 响 程度 。LEE 等 中 基于 韩国 
角度 出 发 ， 探 究 人 力 资 源 开发 对 其 他 学 科 的 影响 以 及 
其 他 学 科 对 人 力 资源 开发 研究 的 影响 ， 来 探索 人 力 资 
源 开 发 的 跨 学 科 性 质 ， 对 其 他 学 科 的 交叉 学 科研 究 有 
借鉴 作用 。 

3.4.2 全 文本 引文 分 析 应 用 于 科学 评价 

目前 对 学 术 研 究 人 员 进 行 评价 一 般 使 用 所 发 文章 
的 正 值 作为 判断 依据 ， 但 仍 有 各 种 研究 试图 找寻 更 合 
理 合 适 的 科学 评价 方式 。 

(1) 学 术 评价 。GILIAREVSKII 等 外 梳理 了 近代 中 
国 引入 的 科学 活动 成 果 评 价 的 相关 变化 ， 以 及 世界 主 
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要 国家 对 各 国 出 版 物 在 索引 中 的 不 平衡 进行 讨论 ， 指 
出 需要 建立 自己 国家 的 评价 指标 以 排除 国外 学 术 的 优 
先 权 。 在 此 基础 上 ， 人 迫切 需要 建立 符合 国家 国情 的 ， 
有 自主 权 的 ， 全 面 可 靠 的 论文 学 术 评 价 体 系 。CHEN 
等 四 使 用 Tobit 回归 模型 探讨 跨 学 科 成 分 的 引用 强度 与 
论文 科学 影响 力 之 间 的 关系 。DAUD 等 外 根据 引文 的 
上 下 文 对 文章 进行 科学 评估 ， 得 到 基于 上 下 文 的 文章 
影响 因子 (CBAEF ) ， 该 因子 不 仅 考虑 引用 的 积极 、 消 
极 或 中 立 背 景 ， 还 涉及 引用 和 被 引用 作者 的 利益 冲突 
关系 。 杨 思 洛 等 外 将 全 文本 分 析 方 法 融入 传统 二 维 评 
价 模型 ， 融 合 出 一 个 新 的 指标 ， 命 名 为 学 术 和 社会 影 
响 力 指标 ， 并 在 此 基础 上 提出 了 新 的 论文 影响 力 评价 
模型 四。 

(2) 专利 评价 。 彭 爱 东 吨 、 闫 雪 等 四 均 对 专利 引文 
分 析 在 企业 竞争 情报 中 的 具体 应 用 做 出 了 探究 ， 并 进 
行 了 以 联想 企业 为 例 的 实证 研究 。 王 文平 等 四 则 对 美 
国 军工 巨头 在 美国 专利 商标 局 中 授权 的 专利 引用 情况 
统计 分 析 ， 并 探究 专利 引文 与 军工 领域 之 间 的 关系 。 
赵 黎 明 等 四 对 专利 引文 分 析 在 知识 转移 机 制 研 究 中 的 
应 用 做 出 探究 ， 并 对 二 者 之 间 关 系 进行 了 深入 探讨 四 ， 
除 此 之 外 ，LI 等 号 分 析 了 审查 人 员 和 发 明 人 /申请 人 的 
不 同 引用 动机 ， 并 确定 了 4 个 不 同 假设 以 确定 专利 中 
的 科学 联系 。 

(3) 作者 评价 。AN 等 四 从 位 置 和 内 容 两 个 角度 来 
进行 分 析 ， 探 讨 高 被 引 作者 的 特点 ， 并 对 不 同位 置 进 
行 具体 分 析 ， 构 建 了 不 同位 置 的 作者 引用 网 络 。GAS- 
PARYAN 等 四 综合 了 一 些 广泛 使 用 的 作者 影响 指标 ， 
并 得 到 它们 的 最 佳 使 用 场景 。ZHENG 等 四 基于 z 指数 
建立 了 一 个 基于 主题 作者 引文 的 三 维 人 才 评 价 模型 ， 
并 提出 了 ZAS 指数 来 评价 学 科 内 部 不 同 研究 主题 的 学 
者 。 宋 艳 辉 外 基于 引文 分 析 与 人 力 资本 的 计算 ,探究 
不 同方 法 在 人 才 评 价 体系 中 的 应 用 ， 以 构建 更 好 指标 
更 全 面 直观 的 评价 人 才 。 

3.4.3 全 文本 引文 分 析 应 用 于 在 其 他 领域 

关于 未 来 的 研究 方向 ，ANDERSON 吧 针对 某 一 篇 
组 织 学 习 领 域 的 文章 进行 引用 分 析 ， 对 其 中 的 正面 引 
用 和 负面 引用 均 做 了 相关 分 析 ， 并 在 此 基础 上 确定 了 
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未 来 研究 的 几 个 重要 方向 。 关 于 如 何 利用 全 文本 引文 
分 析 阅 读 领 域 文献 GIPP 等 四 提出 引文 邻近 分 析 法 
(CPA) 方法 来 对 相近 文章 进行 识别 ， 可 以 在 此 基础 上 
快速 找到 研究 相关 文献 。 关 于 如 何 更 好 判断 作者 共 被 
3|, JEONG 等 四 在 传统 方式 作者 共 引 分 析 (ACA) 
上 ， 考 虑 作者 的 引用 内 容 来 衡量 共同 引用 作者 之 间 的 
相似 性 。 关 于 引用 价值 ， 芝 秋 茹 等 四 在 引用 强度 fu 
置 、 情 感 等 角度 基础 上 ， 研 究 出 信息 计算 引文 指标 以 
深入 探讨 引用 的 价值 ， 得 出 专家 普遍 更 认可 结果 位 置 
的 引用 。 张 汝 吴 等 四 将 引用 语义 和 语 境 特征 相互 融合 ， 
基于 施 引 动机 的 相似 性 这 一 本 质 层面 优化 引文 耦合 强 
度 ， 提 出 一 种 融合 引用 语义 和 语 境 特征 的 作者 引文 看 
合 分 析 法 。 除 了 学 术 方 面 ， 全 文本 引文 分 析 还 可 以 泛 
化 到 其 他 领域 ， 例 如 基于 大 数据 挖掘 技术 ， 探 究 全 文 
本 视野 下 上 海 市 政务 新 媒体 的 内 容 生 产 和 传播 特征 四 。 
或 以 微 博 社 交 媒 体 平台 上 的 发 布 内 容 为 数据 来 源 ， 讨 
论 微 博 写 作 中 的 新 闻 概 念 问题 加。 各 卫 华 W 还 在 此 基础 
上 延 探 究 全 文本 方法 与 传统 的 新 闻 研 究 方法 的 差异 。 


4 研究 述评 


4.1 全 文本 引文 分 析 研究 内 容 


(1) 引用 位 置 。 总 体 而 言 ， 目 前 的 研究 结果 显示 ， 
无 论 是 定性 还 是 定量 ,引文 在 全 文中 所 处 位 置 和 引文 
的 功能 是 相关 的 ， 一 般 来 说 处 于 文章 重要 结构 的 引文 ， 
在 后 续 的 评价 体系 以 及 涉及 的 学 科 交 叉 测 度 中 所 起 到 
的 作用 就 越 大 中 。 全 文本 引文 分 析 除 了 和 常用 于 学 术 性 文 
章 的 分 析 ， 也 可 以 往外 扩展 到 学 术 性 著作 ， 未 来 也 可 
以 再 继续 扩大 适用 范围 例如 专利 、 课 题 申 报 等 。 

(2) 引用 强度 。 引 用 强度 研究 往往 不 是 单独 出 现 
的 ， 一 般 都 与 引用 位 置 研究 密切 相关 。 即 使 同一 篇 文 


性 有 关 ， 和 内 容 词 不 同 ， 线 索 词 只 表示 情感 和 状态 ， 
与 写作 时 的 研究 对 象 和 研究 内 容 没 有 太 大 关联 ， 从 这 
点 来 看 ， 线 索 词 可 以 作为 引用 语 境 分 类 的 相关 判断 标 
准 。 对 于 内 容 词 的 进一步 研究 还 需要 后 来 者 深入 ; 目 
前 对 于 引用 情感 分 析 ， 主 要 集中 在 情感 分 类 以 及 情感 
分 类 模型 等 研究 方面 ， 今 后 随 着 计算 机 以 及 人 工 智能 
技术 的 进一步 发 展 ， 机 器 学 习 深 度 学 习 等 计算 机 研究 
技术 及 方法 会 与 引用 情感 分 析 研 究 进一步 融合 ， 推 动 
该 领域 的 进一步 发 展 ; 关于 引用 行为 需要 注意 的 是 ， 
作者 的 引用 行为 并 不 一 定 完 全 代表 其 引用 动机 的 初衷 ， 
引用 行为 是 一 个 可 以 清晰 查看 和 量化 的 研究 对 象 ， 但 
研究 动机 更 多 地 偏向 于 一 种 思想 过 程 ， 如 何 增加 引用 
动机 偏向 的 可 靠 性 以 及 探 明 学 术 引 用 行为 发 生 作 用 机 
制 原 理 ， 还 需要 进一步 的 研究 和 论证 。 


4.2 全 文本 引文 分 析 主 要 应 用 


全 文本 引用 分 析 在 路 学 科研 究 方面 ， 主 要 集中 在 
测度 方法 、 模 型 与 指标 的 精进 上 ， 对 于 交叉 学 科研 究 
来 说 ， 不 仅 要 利用 引文 分 析 ， 还 要 结合 其 他 计量 学 指 
标 和 测度 方法 ， 以 便 更 好 的 对 交叉 学 科 进 行 测度 ; E 
对 学 术科 学 评价 的 讨论 一 直 在 进行 中 ， 中 国 以 中 科 院 
为 首 一 直 在 尝试 降低 国外 期 刊 对 中 国学 术 界 的 门槛 设 
置 以 及 软 影 响 。 如 何 设置 出 合理 的 ， 符 合 中 国 国情 的 
学 术科 学 评价 体系 及 指标 ， 还 需要 进一步 的 深入 研究 ， 
除 此 之 外 ， 还 要 注意 社交 媒体 快速 发 展 情况 下 网 络 媒 
体 的 引用 问题 ; 除了 跨 学 科 和 科学 评价 上 的 应 用 以 外 ， 
全 文本 引文 分 析 还 在 其 他 领域 有 所 发 展 ， 对 某 一 学 科 
发 展 趋势 判断 ， 深 入 挖掘 线 上 数据 等 方面 有 所 建树 。 


4.3 中 外 全 文本 分 析 的 差异 比较 


(1) 引用 位 置 。 国 内 前 期 侧重 于 全 文本 引用 位 置 
定性 分 析 ， 主 要 用 于 判断 不 同学 术 发 表 形式 中 的 引用 


章 引 用 次 数 相同 ， 但 引用 位 置 不 同 ， 引 用 强度 也 会 有 


位 置 是 否 与 引文 功效 有 相关 关系 ; 国外 侧重 于 引用 位 


所 不 同 。 除 此 之 外 ， 还 有 关于 引用 次 数 与 强度 的 计算 

方法 ， 目 前 这 方面 的 研究 较 少 ， 有 待 进一步 扩展 。 
(3) 引用 语 境 。 在 引用 词语 研究 中 ， 研 究 者 更 倾 

向 于 使 用 线索 词 ， 这 可 能 与 线索 词 的 定义 内 涵 以 及 属 
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置 定量 分 析 ， 多 利用 数学 方法 和 公式 对 引用 位 置 的 具 
体 功效 进行 定量 化 计算 。 近 期 国内 也 逐渐 转变 为 定量 
分 析 为 主 ， 相 继 产 出 较为 系统 的 可 靠 的 定量 量度 方法 。 

(2) 引用 强度 。 引 用 强度 分 析 主 要 分 为 单纯 引用 


强度 以 及 结合 引用 位 置 的 分 析 。 通 过 对 文献 作者 关系 
进行 梳理 ， 发 现 DING 教授 团队 与 国内 章 成 志 教 授 团 
队 有 合作 关系 并 对 该 方向 研究 较 深 ,不 论 单 强度 还 是 
与 位 置 结合 分 析 均 产 出 了 一 系列 相关 文献 ， 促 进 了 引 
用 强度 这 一 概念 的 推广 。 

(3) 引用 语 境 。 词 语 选用 方面 ， 国 外 学 者 对 词语 
的 用 词 偏好 和 引用 之 间 的 关系 进行 较 多 研究 ， 国 内 该 
方向 以 胡 志 刚 教授 团队 研究 较 深 入 。 且 均 侧 重 于 线索 
词 的 分 析 研 究 ， 内 容 词 由 于 其 自身 特性 研究 较 少 ; 情 
感 分 析 方 面 ， 国 外 研究 较为 全 面 丰富 ， 国 内 研究 较 少 ， 
目前 侧重 于 情感 分 析 模 型 的 设置 和 训练 上 ， 依 托 大 数 
据 分 析 、 机 器 学 习 、 深 度 学 习 等 计算 机 技术 ; 引用 动 
机 和 行为 方面 ， 国 内 外 对 其 研究 方向 大 致 一 致 ， 对 于 
动机 和 行为 分 类 以 及 方法 目前 较为 统一 ， 且 目前 有 向 
除 文 章 以 外 的 其 他 学 术 发 表 模 式 推广 的 趋势 。 

(4) 引文 应 用 。 在 学 科 交 又 测 度 中 ， 国 外 研究 人 
员 开 始 较 早 基础 扎实 ， 但 近 几 年 中 国 以 张 琳 教 授 等 人 
为 代表 ， 在 前 人 基础 上 进行 改革 创新 ， 推 出 较为 完备 
的 学 科 交 叉 测度 综合 指标 体系 ， 这 可 能 与 中 国 推行 交 
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对 于 不 同 的 开放 数据 网 站 ， 数 据 的 质量 有 所 不 同 ， 数 
据 量 的 大 小 也 有 所 不 同 。 此 外 ， 目 前 的 全 文 开 放 性 数 
据 库 集中 于 医学 生物 等 领域 ， 对 于 社会 学 科 的 投入 较 
少 。 目 前 各 大 出 版 集团 均 对 旗下 各 杂志 陆续 开通 OA 
网 络 首发 等 模式 ， 数 据 量 的 持续 增长 是 可 以 预见 的 。 后 
续 是 否 可 以 跨 数据 库 进行 研究 ， 还 需要 进一步 的 分 析 。 

(2) 方法 精度 和 效率 。 对 于 同一 份 数 据 ， 采 用 不 
同 的 计算 方法 得 到 的 结果 也 有 所 不 同 。 目 前 对 于 全 文 
本 引文 分 析 的 处 理 方法 ， 主 要 借助 于 计算 机 领域 的 方 
法 借用 ， 目 前 还 没有 比较 普遍 可 靠 的 属于 本 专业 的 成 
熟 的 计算 机 分 析 模 型 ， 需 要 进一步 研究 以 适应 本 学 科 
的 发 展 ， 以 提高 全 文本 引文 分 析 的 精度 和 效率 。 

(3) 路 语言 引用 分 析 。 虽 然 当 前 的 期 刊 文章 语言 
一 般 以 英语 为 主 , 但 仍然 涉及 其 他 语言 的 情况 ， 在 分 
析 引 用 情感 动机 等 方面 ， 需 要 根据 目标 文章 所 使 用 的 
语言 来 进行 适当 的 调整 。 跨 语言 引用 分 析 往 往 会 面临 


要 考虑 词语 的 断 句 以 及 多 义 词 等 复杂 问题 ， 还 需 将 各 


又 学 科 体 系 制 度 建设 有 相关 关系 。 在 科学 评价 上 ， 国 
外 侧重 加 入 全 文本 引文 分 析 的 评价 模型 建设 ， 以 及 作 
者 评价 指标 体系 较为 丰富 ， 国 内 也 提出 了 相关 创新 评 
价 指标 ， 但 相 比较 于 国外 ， 对 于 专利 评价 研究 较 多 。 

总 的 来 说 ， 国 外 对 于 全 文本 引文 分 析 的 研究 开始 
较 早 ， 但 国内 研究 在 前 人 的 基础 上 也 有 较为 丰厚 的 产 
出 。 目 前 国内 外 均 重 视 与 全 文本 引文 分 析 与 先进 计算 
机 技术 结合 ， 力 求 促进 该 领域 发 展 。 


5 全 文本 引文 分 析 研 究 展望 


5.1 全 文本 引文 分 析 研 究 考 虑 的 因素 


全 文本 引文 分 析 目 前 的 研究 仍然 面临 着 许多 问题 
和 挑战 ， 在 展望 全 文本 引文 分 析 未 来 发 展 时 ， 需 要 考 
虑 以 下 4 个 方面 。 

(1) 数据 量 和 数据 质量 。 全 文本 引文 分 析 ， 需 要 
借助 全 文本 开放 数据 库 的 大 量 数据 来 进行 数据 支持 ， 


不 同 语言 专 有 名 词 一 一 对 应 。 这 些 还 只 是 跨 语言 分 析 
需 解 决 问题 的 冰山 一 角 。 需 要 后 续 探 索 更 加 准确 和 有 
效 的 跨 语 言 引 用 分 析 方 法 和 算法 。 

(4) 可 视 化 和 交互 性 提升 。Cite Space、Vos Viewer 
等 软件 的 产生 和 推广 ， 导 致 可 视 化 需要 发 生 增长 ，VR 
等 技术 的 爆发 导致 交互 性 需要 也 提 上 日 程 。 全 文本 引 
文 分 析 需 要 与 这 一 技术 趋势 相 结 合 ， 在 以 往 可 视 化 的 
基础 上 ， 加 入 全 文本 引文 分 析 的 指标 和 可 视 化 图 形 等 ， 
以 求 能 够 更 直观 的 体现 全 文本 引用 分 析 结 果 。 研 究 更 
加 优秀 的 可 视 化 和 交互 性 处 理 方法 ,开发 软件 ， 以 提 
高 全 文本 引文 分 析 的 可 用 性 和 易 用 性 。 


5.2 全 文本 引文 分 析 研 究 的 未 来 趋势 


基于 以 上 分 析 ， 对 于 全 文本 引文 分 析 未 来 的 发 展 
趋势 以 及 可 能 的 发 展 方向 ， 做 出 来 如 下 的 可 能 预测 。 

(1) 引用 语义 分 析 。 当 前 的 全 文本 引文 分 析 主 要 
集中 在 引用 位 置 分 析 和 引用 强度 分 析 上 ， 而 引用 语义 
分 析 还 相对 较 少 。 引 用 语义 分 析 是 指 通过 分 析 引 用 文 


2023 年 第 35 卷 第 9 期 


21 


22 


综述 文章 


DOI; 10.13998/j.cnki.issn1002-1248.23-0428 


献 中 的 语义 信息 ， 了 解 引 文 与 被 引文 之 间 的 相关 性 。 
随 着 自然 语言 处 理 技术 的 不 断 发 展 以 及 相关 计算 机 编 
译 方法 的 更 新 ， 引 用 语义 分 析 或 将 成 为 全 文本 引用 分 
析 的 一 个 重要 方向 。 

(2) 应 用 领域 扩展 。 当 前 的 全 文本 引用 分 析 主 要 
应 用 于 学 术 研 究 领 域 ， 如 学 科 发 展 趋势 、 学 术 合作 关 
系 、 学 术 评价 等 方面 。 在 今后 的 研究 中 ， 全 文本 引用 
分 析 可 以 扩展 到 更 广泛 的 领域 ， 如 商业 、 经 济 学 、 医 
学 技术 等 重要 领域 。 

(3) 大 数据 挑战 。 随 着 互联 网 技术 和 信息 技术 的 
迅猛 发 展 ， 数 据 量 呈 爆炸 式 增长 。 全 文本 引用 分 析 在 
面 对 海 量 数据 时 ， 需 要 处 理 大 量 的 数据 ， 挑 战 也 随 之 
而 来 。 未 来 该 研究 领域 的 学 术 人 员 ， 是 否 能 快速 跟 进 
技术 的 发 展 以 促进 该 研究 领域 的 拓展 ， 又 是 否 引 进 计 
算 机 相关 人 才 ， 或 改进 本 科 及 研究 生 的 修 习 课程 安排 
改革 ， 需 要 今后 进一步 的 研究 和 讨论 。 

(4) 数据 隐私 保护 。 在 进行 全 文本 引文 分 析 时 ， 
涉及 大 量 的 个 人 信息 。 如 何 保护 个 人 数据 隐私 ， 是 全 
文本 引文 分 析 需 要 解决 的 一 个 重要 问题 。 

(5) 实时 性 分 析 。 当 前 的 全 文本 引文 分 析 主 要 基 
于 静态 数据 ， 如 论文 、 专 利 等 ， 而 实时 性 数据 的 引用 
分 析 还 处 于 初级 阶段 。 未 来 ， 全 文本 引文 分 析 需 要 更 
好 地 适应 实时 数据 的 分 析 需 求 。 


6 


nF 


语 


综 上 所 述 ， 目 前 全 文本 引文 的 分 析 主 要 集中 于 引 
用 位 置 分 析 、 引 用 强度 分 析 以 及 引用 语 境 分 析 上 ， 细 
节 上 来 说 ,情感 分 析 热 度 较 高 。 在 应 用 方面 ， 跨 学 科 
分 析 利 用 以 及 用 于 科学 评价 方面 较为 常见 。 面 对 诸多 
挑战 ， 全 文本 引文 分 析 仍 然 具有 较 大 的 发 展 潜力 。 通 
过 对 全 文本 引文 分 析 现 状 ， 应 用 以 及 挑战 进行 梳理 ， 
和 希 豆 对 后 续 研 究 提供 参考 和 借鉴 。 
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Review of Full Text Citation Analysis 


LI Dian, WEN Tingxiao', XU Linyong 
(School of Life Sciences, Central South University, Changsha 410006) 


Abstract: [Purpose/Significance] Citation analysis is an important research field of biblio-metrics, which aims to investigate the citation 


behavior and academic influence of literature by analyzing the citation relationship of literature. Specifically, full-text citation analysis 


can help researchers understand the citation relationship and academic impact of the literature more accurately and comprehensively. 


This paper aims to clarify the development of full-text citation analysis, review the different progress of full-text citation research, and on 


this basis, attempt to analyze the challenges of full-text citation analysis and the possible development direction in the future in order to 


better promote the development of citation analysis of the full text. [Method/Process] Key words and search formulas were determined 


on the CNKI database and the Web of Science database, and then the retrieved results were screened and filtered according to the 


summary. This paper reviews the research results of full-text citation analysis at home and abroad, and summarizes the research contents 


of full-text citation analysis into citation location analysis, citation intensity analysis and citation context analysis. Citation context 
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analysis can be divided into word selection, emotion analysis, motivation and behavior analysis. At the same time, the application of 
citation analysis in interdisciplinary and scientific evaluation is analyzed. A summary of the differences in research content and 
application of full-text citation analysis at home and abroad was provided. [Results/Conclusions] The current research on citation 
analysis of the full text has an important connection with the chapter structure. The reference strength analysis is closely combined with 
the reference position analysis, and the focus is to develop new calculation methods. In the context of citation, the emphasis of citation 
analysis is emotional analysis. The application mainly focuses on the construction of interdisciplinary measurement and scientific 
evaluation system. This paper also predicts the challenges and future directions of citation analysis. The specific factors to be considered 
include data volume and data quality, method accuracy and efficiency, cross language reference analysis, and the improvement of 
visualization and interactivity. In spite of many challenges, the full text citation analysis still has great development potential. In the 
future, it is possible to make progress in citation semantic analysis, expansion of application field, big data analysis, data privacy 
protection and real-time analysis. This paper reviews the current situation, application and challenges of citation analysis, hoping to 
provide reference and insights for future research. At the same time, this study still has some shortcomings, based on the development of 
computer technology, it has some limitations in its discussion on the future development trend. 


Keywords: full text analysis; citation analysis; emotional analysis; reference location analysis 
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